Scholar Hub/Chủ đề/#mô hình markov ẩn/
Mô hình Markov ẩn (HMM) là mô hình thống kê mô tả hệ thống có trạng thái ẩn không quan sát được, được suy luận thông qua chuỗi dữ liệu đầu ra quan sát được. Các trạng thái trong HMM tuân theo quá trình Markov, nghĩa là xác suất chuyển trạng thái chỉ phụ thuộc vào trạng thái hiện tại, không phụ thuộc lịch sử trước đó.
Mô hình Markov ẩn là gì?
Mô hình Markov ẩn (Hidden Markov Model - HMM) là một mô hình thống kê mô tả một hệ thống mà trạng thái thực sự (ẩn) của nó không thể quan sát trực tiếp, nhưng có thể được suy luận thông qua một chuỗi các tín hiệu hoặc dữ liệu quan sát được. Các trạng thái ẩn tuân theo tính chất Markov, nghĩa là xác suất chuyển trạng thái chỉ phụ thuộc vào trạng thái hiện tại và không phụ thuộc vào các trạng thái trước đó. HMM được sử dụng rộng rãi trong các bài toán xử lý ngôn ngữ tự nhiên, sinh học tính toán, nhận dạng mẫu, và mô hình hóa chuỗi thời gian trong tài chính.
Các thành phần cơ bản của HMM
Một mô hình Markov ẩn tiêu chuẩn được xác định bởi năm tham số:
- Tập hợp trạng thái ẩn : Các trạng thái không thể quan sát trực tiếp.
- Tập hợp các quan sát : Các tín hiệu có thể đo đạc hoặc ghi nhận được.
- Ma trận xác suất chuyển trạng thái :
- Ma trận xác suất phát hiện (emission) :
- Phân phối xác suất khởi đầu :
Thông thường, một HMM được ký hiệu tổng quát là .
Ba bài toán cơ bản trong Mô hình Markov ẩn
Để sử dụng HMM hiệu quả, cần giải quyết ba bài toán cơ bản:
- 1. Bài toán đánh giá: Tính xác suất cho chuỗi quan sát đã cho và mô hình . Thuật toán Forward được sử dụng để tính nhanh giá trị này.
- 2. Bài toán giải mã: Xác định chuỗi trạng thái ẩn tối ưu đã sinh ra chuỗi quan sát. Thuật toán Viterbi là kỹ thuật phổ biến nhất cho mục tiêu này.
- 3. Bài toán học tham số: Ước lượng các tham số , , để tối đa hóa . Thuật toán Baum-Welch (một dạng đặc biệt của EM) được sử dụng.
Thuật toán Forward
Thuật toán Forward tính xác suất chuỗi quan sát bằng cách đệ quy, thay vì tính tổng toàn bộ số lượng chuỗi trạng thái tiềm năng:
Định nghĩa biến forward là xác suất quan sát được và hệ thống ở trạng thái tại thời điểm :
Thuật toán tính theo quy trình khởi tạo, đệ quy, và kết thúc để tìm .
Thuật toán Viterbi
Thuật toán Viterbi tìm chuỗi trạng thái ẩn tối ưu với xác suất tối đa. Biến Viterbi được định nghĩa như sau:
Thuật toán cũng dựa trên quy trình khởi tạo, đệ quy, và truy vết ngược để xác định chuỗi trạng thái tốt nhất.
Thuật toán Baum-Welch
Baum-Welch là thuật toán huấn luyện HMM từ dữ liệu quan sát, dựa trên nguyên lý Expectation-Maximization:
- Expectation step: Tính kỳ vọng của số lần chuyển giữa các trạng thái và số lần sinh ra mỗi quan sát.
- Maximization step: Cập nhật , và để tối đa hóa xác suất tổng thể.
Baum-Welch cho phép tìm được tham số hợp lý nhất khi dữ liệu huấn luyện không có nhãn trạng thái.
Ứng dụng thực tiễn của Mô hình Markov ẩn
- Nhận dạng tiếng nói: Các hệ thống như Siri, Alexa, Google Assistant sử dụng HMM để phân tích chuỗi âm thanh và ánh xạ thành từ ngữ, chi tiết trong IEEE Tutorial on HMMs and Speech Recognition.
- Phân tích trình tự sinh học: Dùng để tìm gene, phân tích vùng protein bằng phần mềm như HMMER.
- Dự báo tài chính: HMM giúp mô hình hóa thị trường tài chính không ổn định và xác định các pha thị trường (bò - gấu).
- Nhận dạng chữ viết tay: Áp dụng HMM để nhận dạng chuỗi ký tự viết tay trong tài liệu số hóa.
Ưu điểm và hạn chế của HMM
- Ưu điểm: Hiệu quả trong xử lý chuỗi, yêu cầu ít tham số, dễ diễn giải và dễ tích hợp với các phương pháp học máy khác.
- Hạn chế: Giả định Markov bậc 1 (chỉ phụ thuộc vào trạng thái trước đó) là hạn chế; khó mở rộng với dữ liệu phi tuyến tính hoặc có phụ thuộc dài hạn; học tham số dễ rơi vào cực trị cục bộ.
Các mô hình mở rộng từ HMM
- HMM liên tục: Sử dụng phân phối liên tục như Gaussian để mô hình hóa đầu ra, thay vì tập giá trị rời rạc.
- Hierarchical HMM (HHMM): Mô hình đa cấp, cho phép mô tả quá trình phức tạp hơn với nhiều lớp trạng thái ẩn.
- Conditional Random Fields (CRFs): Khắc phục hạn chế Markov của HMM bằng cách mô hình hóa phân phối có điều kiện, được sử dụng nhiều trong gán nhãn chuỗi.
So sánh HMM với CRFs
Tiêu chí |
HMM |
CRFs |
Kiểu mô hình |
Generative (sinh dữ liệu) |
Discriminative (phân biệt) |
Phụ thuộc trạng thái |
Chỉ trạng thái hiện tại |
Có thể mở rộng nhiều đặc trưng hơn |
Ứng dụng |
Nhận dạng tiếng nói, sinh học |
Gán nhãn chuỗi, phân loại |
Kết luận
Mô hình Markov ẩn là một trong những công cụ nền tảng cho việc phân tích và dự đoán chuỗi dữ liệu trong khoa học máy tính và trí tuệ nhân tạo. Dù tồn tại một số giới hạn về khả năng mô hình hóa các phụ thuộc phức tạp, HMM vẫn giữ vai trò cốt lõi trong nhiều ứng dụng thực tế và là nền tảng cho sự phát triển của các mô hình chuỗi tiên tiến hơn như LSTM và CRFs.
Các Biện Pháp Bayesian Cho Độ Phức Tạp và Độ Khớp Của Mô Hình Dịch bởi AI Journal of the Royal Statistical Society. Series B: Statistical Methodology - Tập 64 Số 4 - Trang 583-639 - 2002
Tóm tắtChúng tôi xem xét vấn đề so sánh các mô hình phân cấp phức tạp trong đó số lượng tham số không được xác định rõ. Sử dụng lập luận thông tin lý thuyết, chúng tôi đưa ra một thước đo pD cho số lượng tham số hiệu quả trong một mô hình như sự khác biệt giữa trung bình hậu nghiệm của độ lệch và độ lệch tại giá trị trung bình hậu nghiệm của các tham số quan trọng....... hiện toàn bộ
#Mô hình phân cấp phức tạp #thông tin lý thuyết #số lượng tham số hiệu quả #độ lệch hậu nghiệm #phương sai hậu nghiệm #ma trận 'hat' #các họ số mũ #biện pháp đo lường Bayesian #biểu đồ chuẩn đoán #Markov chain Monte Carlo #tiêu chuẩn thông tin độ lệch.
Một mô hình Markov ẩn trong dự báo chỉ số chứng khoán VN-IndexPhân tích và dự đoán thị trường cổ phiếu là một trong những lĩnh vực thúvị mà trong đó dữ liệu lịch sử có thể được sử dụng để ước tính và dự đoán dữliệu và thông tin của tương lai. Về mặt kỹ thuật mà nói, lĩnh vực này có tầmquan trọng lớn cho các chuyên gia trong tài chính và thị trường chứng khoánnhư là họ co thể nắm bắt và điều chỉnh xu hướng tương lai hoặc quản lý khủnghoảng theo thời gian. Tro...... hiện toàn bộ
So sánh phương pháp nhận dạng hành động con người trong đoạn video quay bằng một camera dùng DTW và HMMTrong bài báo này, chúng tôi tìm hiểu và so sánh hai thuật toán nhận dạng Dynamic Time Warping (DTW) và mô hình Markov ẩn HMM. Trước tiên, từ mỗi khung video, chúng tôi ước lượng tư thế người 3D, bao gồm tọa độ 3D của các khớp đặc trưng, dùng kỹ thuật mô hình hóa cơ thể 3D; rồi chuyển các tọa độ này sang thuộc tính quan hệ hình học GRF, mô tả quan hệ hình học giữa các khớp trong một tư thế nhằm gi...... hiện toàn bộ
#Dynamic Time Warping (DTW) #Nhận dạng hành động con người #mô hình hóa người 3D #thuộc tính quan hệ hình học #mô hình Markov ẩn tuần hoàn
Tối ưu hóa độ dài mô hình Hidden Markov cho các hệ thống nhận dạng chữ viết tay Dịch bởi AI Proceedings Eighth International Workshop on Frontiers in Handwriting Recognition - - Trang 369-374
Bài báo này điều tra việc sử dụng ba phương thức khác nhau để tối ưu hóa số trạng thái của các mô hình Hidden Markov (HMM) theo dạng tuyến tính từ trái qua phải. Phương pháp đầu tiên mà chúng tôi mô tả là sơ đồ mô hình có độ dài cố định, trong đó mỗi mô hình ký tự được gán cùng một số trạng thái. Phương pháp thứ hai được xem xét là mô hình độ dài Bakis, trong đó số trạng thái mô hình được xác định...... hiện toàn bộ
#Mô hình Hidden Markov #Nhận dạng chữ viết tay #Định dạng #Nhận dạng giọng nói #Nhận dạng ký tự #Tin học #Toán học #Biểu đồ tần số #Cơ sở dữ liệu hình ảnh #Thuật toán Viterbi
Ước lượng tối đa khả năng và ước lượng tối đa khả năng hạn chế cho một lớp các trường ngẫu nhiên Markov Gaussian Dịch bởi AI Springer Science and Business Media LLC - Tập 74 - Trang 167-183 - 2009
Bài viết này mô tả một mô hình trường ngẫu nhiên Markov Gaussian bao gồm một số mô hình đã được đề xuất trước đó, và nghiên cứu các thuộc tính của ước lượng tối đa khả năng (ML) và ước lượng tối đa khả năng hạn chế (REML) trong một trường hợp đặc biệt. Cụ thể, đối với các mô hình mà một mối quan hệ cụ thể giữa các ma trận hồi quy và ma trận chính xác của mô hình được giữ, chúng tôi cung cấp các đi...... hiện toàn bộ
#Mô hình trường ngẫu nhiên Markov Gaussian #ước lượng tối đa khả năng #ước lượng tối đa khả năng hạn chế #tham số hiệp phương sai #thuật toán ước lượng.
Đã bao lâu kể từ lần khuyến mại cuối cùng? Kỳ vọng về thời gian khuyến mãi của người tiêu dùng và phản ứng đối với khuyến mại Dịch bởi AI Quantitative Marketing and Economics - Tập 12 - Trang 85-126 - 2013
Khi mô hình hóa hành vi tìm kiếm tương lai của người tiêu dùng bằng dữ liệu lựa chọn về các sản phẩm thường xuyên được mua, phương pháp thông dụng giả định rằng người tiêu dùng có kỳ vọng hợp lý về các chương trình khuyến mãi trong tương lai. Các nghiên cứu trước đã mô hình hóa những kỳ vọng như vậy bằng cách sử dụng quá trình Markov bậc một (FOM). Tuy nhiên, bằng chứng thực nghiệm từ một số danh ...... hiện toàn bộ
#Hành vi tìm kiếm của người tiêu dùng #kỳ vọng hợp lý #khuyến mãi #mô hình nguy cơ tỷ lệ #Markov bậc một #quyết định quản lý.
Dự đoán suy thoái đồng cỏ ở đồng bằng Songnen phía tây nam bằng mô hình Markov hỗ trợ RS và GIS Dịch bởi AI Geo-spatial Information Science - Tập 8 - Trang 104-109 - 2005
Bằng cách lấy thành phố Daan ở tỉnh Jilin làm đối tượng nghiên cứu và sử dụng hình ảnh TM vào năm 1989 và hình ảnh ETM+ vào năm 2001 từ vệ tinh LANDSAT của Mỹ, các loại bản đồ và tài liệu, thông tin về đồng cỏ, đất kiềm mặn, đất nông nghiệp, khu vực nước và rừng được trích xuất bằng phương pháp giải thích tương tác giữa người và máy với phần mềm GIS Arc View và ArcInfo, và dữ liệu thống kê được th...... hiện toàn bộ
#Suy thoái đồng cỏ #Mô hình Markov #GIS #RS #Đồng bằng Songnen #Hình ảnh LANDSAT
Chi phí tối ưu và chính sách cho vấn đề thay thế Markov Dịch bởi AI Journal of Optimization Theory and Applications - Tập 71 Số 1 - Trang 105-126 - 1991
Chúng tôi xem xét việc tính toán chi phí tối ưu và chính sách liên quan đến một bài toán thay thế Markov hai chiều với quan sát một phần, trong hai trường hợp chất lượng quan sát đặc biệt. Dựa vào các kết quả cấu trúc có sẵn cho chính sách tối ưu liên quan đến hai mô hình đặc thù này, chúng tôi chỉ ra rằng, trong cả hai trường hợp, hàm chi phí tối ưu giảm dần theo vô hạn là phi tuyến bậc nhất, và ...... hiện toàn bộ
#thay thế Markov #chi phí tối ưu #chính sách tối ưu #quan sát một phần #hàm chi phí giảm dần
NHẬN DẠNG CHUYỂN ĐỘNG QUAY DỰA TRÊN MÔ HÌNH MARKOV ẨN VÀ CONFORMAL GEOMETRIC ALGEBRANgày nay, các nhà nghiên cứu đã phát triển một công cụ toán học Geometric Algebra có khả năng biểu diễn các đối tượng trong không gian 3 chiều rất chính xác và hiệu quả. Vì vậy, nó có thể ứng dụng vào các lĩnh vực nhận dạng vật thể hay nhận dạng các hành vi của đối tượng 3 chiều. Trong bài báo này, tác giả đã đề xuất mô hình Markov ẩn kết hợp với mật độ xác xuất trên không gian Conformal Geometric...... hiện toàn bộ
#Đại số hình học #học máy #mô hình xác suất #Mô hình Markov ẩn #mật độ Gauss